انتخاب اعضای ترکیب در خوشهبندی ترکیبی با استفاده از رأیگیری
نویسندگان
چکیده مقاله:
Clustering is the process of division of a dataset into subsets that are called clusters, so that objects within a cluster are similar to each other and different from objects of the other clusters. So far, a lot of algorithms in different approaches have been created for the clustering. An effective choice (can combine) two or more of these algorithms for solving the clustering problem. Ensemble clustering combines results of existing clusterings to achieve better performance and higher accuracy. Instead of combining all of existing clusterings, recent decade researchers show, if only a set of clusterings is selected based on quality and diversity, the result of ensemble clustering would be more accurate. This paper proposes a new method for ensemble clustering based on quality and diversity. For this purpose, firstly first we need a lot of different base clusterings to combine them. Different base clusterings are generated by k-means algorithm with random k in each execution. After the generation of base clusterings, they are put into different groups according to their similarities using a new grouping method. So that clusterings which are similar to each other are put together in one group. In this step, we use normalized mutual information (NMI) or adjusted rand index (ARI) for computing similarities and dissimilarities between the base clustering. Then from each group, a best qualified clustering is selected via a voting based method. In this method, Cluster-validity-indices were used to measure the quality of clustering. So that all members of the group are evaluated by the Cluster-validity-indices. In each group, clustering that optimizes the most number of Cluster-validity-indices is selected. Finally, consensus functions combine all selected clustering. Consensus function is an algorithm for combining existing clusterings to produce final clusters. In this paper, three consensus functions including CSPA, MCLA, and HGPA have used for combining clustering. To evaluate proposed method, real datasets from UCI repository have used. In experiment section, the proposed method is compared with the well-known and powerful existing methods. Experimental results demonstrate that proposed algorithm has better performance and higher accuracy than previous works.
منابع مشابه
اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملانتخاب استراتژی بهینه با استفاده از ترکیب تکنیکهایSWOT و FANP
بقا و حیات یک سازمان منوط به تصمیمگیری صحیح در مواجه با فرصتها و تهدیدات موجود در محیط بیرونی سازمان میباشد. ازآنجاییکه هیچ سازمانی نمیتواند منابع نامحدود داشته باشد استراتژیست ها باید در این مورد که کدامیک از استراتژیهای مختلف میتوانند بیشترین منفعت را به سازمان برسانند، تصمیمگیری نمایند. از طرفی تحلیل SWOT مدیران را قادر به کشف و شناسایی عوامل داخلی و خارجی مؤثر بر استراتژیهای سازما...
متن کاملانتخاب سبد سهام فازی با استفاده از الگوریتم هوشمند ترکیبی با در نظر گرفتن ریسک نامطلوب
مطالعات تجربی نشان میدهد بازده داراییها نرمال و متقارن نمیباشد، بنابراین واریانس نمیتواند بهدرستی بهعنوان معیار ریسک مناسب مورداستفاده قرار گیرد. در این پژوهش بازده داراییها بهعنوان یک عدد فازی در نظر گرفتهشده است و از معیار ریسک نامطلوب، نیمه واریانس و نیمه قدر مطلق انحراف از میانگین بهعنوان معیار ریسک استفادهشده است. در ادامه بهمنظور حل مدلهای مذکور از دو روش هوشمند ترکیبی بر مبن...
متن کاملانتخاب دید جهت ذخیرهسازی دید در پایگاه داده تحلیلی با استفاده از الگوریتم فرهنگی ترکیبی
پایگاه داده تحلیلی حجم زیادی از دادهها که در سیستمهای تصمیمگیرنده و گزارشگیر مورد استفاده قرار میگیرد را ذخیره میکند. در این سیستمها سرعت پاسخگویی به پرسوجوها به علت حجم زیاد دادههای ذخیرهشده، پایین است. از آنجایی که این سیستمها عموماً مورد استفاده مدیران ارشد در سازمانهای مختلف هستند، درنتیجه افزایش سرعت در این سیستمها حائز اهمیت است. یکی از روشهای افزایش سرعت، ذخیره دیدها جهت پ...
متن کاملانتخاب بهینه وب سرویسهای مکانی در ترکیب سرویسها با استفاده از کیفیت سرویس مکانی
یکی از مسائل قابل توجه و پراهمیت در سامانههای اطلاعات مکانی تعامل پذیری است. با ظهور فنآوری وب سرویسها و الگوی معماری سرویسگرا در سامانههای اطلاعات مکانی، اشتراک دادههای مکانی از روش کلاسیک و داده مبنا به روش توزیع پذیر و سست پیوند تبدیل شد. با افزایش درخواست کاربران برای اطلاعات مکانی، سازمانها و افراد زیادی با توجه به استانداردهای اطلاعات مکانی (استاندارد OGC)، سرویسهای مکانی خود را ا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 15 شماره 4
صفحات 17- 30
تاریخ انتشار 2019-03
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023